草庐IT

python - Pandas :有条件的转变

全部标签

python - lxml.etree 和 xml.etree.ElementTree 添加没有前缀的命名空间(ns0、ns1 等)

是否有任何解决方案可以添加不带前缀的命名空间(我的意思是这些ns0、ns1),它们适用于所有etree实现,或者每个实现都有可行的解决方案?目前我有以下解决方案:lxml-元素的nsmap参数(c)ElementTree(python2.6+)-以空字符串作为前缀注册命名空间方法问题是python2.5中的(c)ElementTree,我知道有_namespace_map属性但将其设置为空字符串会创建无效的XML,将其设置为None添加默认的ns0等namespace,是否有任何可行的解决方案?我猜Element('foo',{'xmlns':'http://my_namespace_

python - 使用 Python 在 ElementTree 中添加兄弟元素

用XML比如我需要添加类似的兄弟ElementTree有添加兄弟节点的功能吗?如果没有,我想我需要一个函数来获取父节点并添加子节点,我该怎么做? 最佳答案 在标准库的版本中,您不能直接访问父级,您必须从父级开始工作,或者自己跟踪父子关系,阅读thesetips(来自图书馆的作者)。如果您使用lxml但是,有getparent()方法(您还有getnext()和getprevious()),但更方便:有是addnext()和addprevious()。因此,根据您使用的ElementTree实现选择这些解决方案之一(或者甚至可能切换您

python - 对使用哪个 XML 处理选项感到困惑

我是Python的新手,我才刚刚开始使用XML解析。我对使用XML的所有选项感到有点不知所措,我希望有经验的人可以为我正在处理的简单问题提供一些建议(也许还有代码示例??)。我正在开发一个不涉及数据库的简单Python联系人管理应用程序-每个联系人的信息都使用XML存储在单独的文本文件中。例如,假设以下是文件“1234.xml”的内容1234JohnnyAppleseed81455512121234MainStreetHometownOH1313MockingbirdLaneWhitePlainsNY为了举例,我们假设只能有一个电话号码,但有多个地址block。对于我在这里所做的事情,

xml - 使用 XSLT 1.0 将 XML 元素根据某些条件按顺序分组到桶中

假设我有一些要转换为HTML的XML。XML分为有序的部分:Title1paragraph1-1paragraph1-2Subtitle2listitem2-1listitem2-2listitem2-3listitem2-4Warning:ThisproductcouldkillyouYouwerewarnedCopyright1999-2011我有几个这样的XML文档。我需要根据标准对这些部分进行分组和转换。将有两种不同的桶。所以第一部分将在桶(例如)如果第二部分符合标准有资格获得“FormatOne”桶吧也将进入这个桶如果第三部分需要不同的桶(例如)然后是一个新的桶被创建和部分内

xml - 使用 XML 模式进行条件验证

这可能是基本的,但我很难用我对XML和XML模式的基本知识来实现​​它。如有任何帮助,我们将不胜感激。给定以下XML文件片段:...3Userenteredinerror......1...有没有一种方法可以有条件地验证XML文件以确保当时,字符串元素是必需的数字元素的值为3但在时可选是另一个值吗?提前致谢... 最佳答案 不,你不能,不是XML模式。在使用架构验证XML结构并确保其内容有效后,您需要在代码中编写该逻辑。 关于xml-使用XML模式进行条件验证,我们在StackOverf

xml - 我如何选择我当前流程元素的后续兄弟,直到它满足使用 xslt 2.0 的 foreach 中的条件?

这是我的XML文档(小片段)。Paragraph1tableinfoParagraph2Paragraph3Paragraph4Paragraph5Paragraph6在这里,我想选择第一个的以下同级使用for-each语句直到遇到下一个有它的.例如,对于第一个我只想选择接下来的三个sibling。(即第2段、第3段和包括表信息)。因为,第4有.第4个相同的案例如果是当前节点。然后我只想选择第5个.我不知道如何在for-each中指定这个条件。所以,你能指导我得到这个吗...我需要的输出是这样的:paragrap1tableinfoparagrap2paragrap3paragrap4

python - 用 Python 的 elementtree 替换作为数字字符引用一部分的&符号

我正在使用Python的elementtree模块编写一些XML(我正在使用Python2.7和3.2)。我的某些元素的文本字段包含数字字符引用。但是,一旦我使用elementtree的tostring,字符引用中的所有&符号都将替换为&。显然,elementtree或底层解析器无法识别这里的&符号是数字字符引用的一部分。经过一番搜索,我发现了这个:elementtreeandentities但是,我也不热衷于此,因为在我当前的代码中,我预见到这最终可能会导致其自身出现问题。除此之外,我在这方面发现的很少,所以也许我只是忽略了一些明显的东西?以下简单的测试代码说明了问题(使用P

python - 在 Python 中从 Word 文档 (.docx) 中提取突出显示的单词

我正在处理一堆word文档,其中我有突出显示的文本(单词)(使用颜色代码,例如黄色、蓝色、灰色),现在我想提取与每种颜色相关的突出显示的单词。我正在用Python编程。这是我目前所做的:用[python-docx][1]打开word文档然后到达包含文档中标记(单词)的标记。我使用了以下代码:#!/usr/bin/envpython2.6#-*-coding:ascii-*-fromdocximport*document=opendocx('test.docx')words=document.xpath('//w:r',namespaces=document.nsmap)forwordi

xml - 使用 XSLT 根据节点数转换带有条件的 XML

我正在尝试从XML文件中删除节点。我的每个XML只使用一个XSLT,我需要根据文档元素的子元素数量在XSLT中做出决定。bar应该转化为但是barbaz进入也就是说,如果根元素(唯一的)子元素在应用XSLT后可以充当结果XML的新文档根,则应删除根元素。每次出现时都必须删除节点。有没有办法用单个XSL执行此操作? 最佳答案 尝试 关于xml-使用XSLT根据节点数转换带有条件的XML,我们在StackOverflow上找到一个类似的问题: https://st

python - python中的lxml xpath,如何处理丢失的标签?

假设我想用lxmlxpath表达式解析以下xml5201412这是可以在http://python-thoughts.blogspot.fr/2012/01/default-value-for-text-function-using.html找到的内容的变体我怎样才能实现对不同元素的解析,这些元素一旦被压缩(在zip或izippython函数意义上)就会给我[(520,14),(12,无)]?第二个packitem中缺少的max_count标签阻碍了我获得我想要的东西。 最佳答案 deflxml_empty_str(context,